iT邦幫忙

2022 iThome 鐵人賽

DAY 25
0
AI & Data

TensorFlow 系列 第 25

[Day25] 類別特徵資料處理

  • 分享至 

  • xImage
  •  

Hi ! Day25 !
今天要來介紹類別特徵與資料處理 — 編碼

什麼是類別特徵?

類別特徵主要是指性別(男、女)、血型(A、B、AB、O)、城市、顏色等類似的在有限選項內取值的特徵。


標籤編碼Label Encoding

  • 把每個類別轉換到某個整數
  • 不會增加新欄位
  • 類似流水號

獨熱編碼One-hot Encoding

  • 每個類別新增一個欄位
  • 0/1 表示 是/否

(晚一點附上實作的部分~)


Reference

https://medium.com/@hupinwei/類別資料的處理-label-encoding-and-one-hot-encoding-81344d1cc47

https://easyaitech.medium.com/一文看懂分类特征-附5种编码方式-优缺点-c29d908e8bdb


上一篇
[Day24] 類神經回歸的metrics指標
下一篇
[Day26] 特徵值數據標準化
系列文
TensorFlow 30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言